id name score
1 1 Anna NA
2 2 Ben 80
3 3 Chris 90
4 4 <NA> 70
Unterschiede zwischen den diversen Joins:
Unterschiede zwischen den diversen Joins:
Unterschiede zwischen den diversen Joins:
Unterschiede zwischen den diversen Joins:
Check-in:
Nun sollte jede/r einen Datensatz dat_full haben, der alle 7 Einzeldatensätze beinhaltet mit 159Versuchspersonen (= Zeilen) und 36 Variablen (= Spalten).
Checkt mit euren Peer-Partner:innen/Sitznachbar:innen!
Mit diesem Datensatz werden wir die Analysen von Grinschgl et al. (2020) durchführen.
Zu diesem Datensatz sollt ihr bis zum 22.10. den ersten Entwurf für das Codebook schreiben!
Fehlererkennung in R
Der Code läuft nicht. Wie könnt ihr vorgehen um den Fehler zu identifizieren und beheben?
Lies die Fehlermeldung!
Überprüfe:
✅Tippfehler
✅Klammern
✅Syntaxfehler
✅Datentypen
✅Pakete
Googeln hilft oft weiter!
Fehlermeldungen lassen sich einfacher googeln, wenn R auf Englisch eingestellt ist:
👉Sys.setenv(LANGUAGE = "en")
oft ist es auch hilfreich, das Betriebssystem anzugeben: sessionInfo()
Fehlererkennung in R – Tipps
class() / str() zur Objektprüfung 👉
In mean.default(x) : argument is not numeric or logical: returning NA
Keine Garantie für Korrektheit → Code kann plausibel wirken, aber methodisch unangemessen sein.
Overreliance / Cognitive Offloading → Reduziertes Verständnis dessen, was man tut
Nicht immer Best-Practice-Beispiele → Verletzung wissenschaftlicher Standards
“Fast but Flawed”
⚠️Datenschutz: Niemals sensible Daten in LLMs hochladen ⚠️
Sinnvolle Nutzung von KI im Datenanalyseprozess:
💚Sinnvoll: Unterstützend – nicht ersetzend
Kontrolle einfacher Fehler (Klammern, Typos)
Erklärung von Code und Syntax
Hilfe bei Fehlersuche (Debugging)
Kommentierung und Dokumentation
💔Nicht sinnvoll: Ersatz statt Unterstützung
Generierung ganzer Analyse-Skripte
Automatische Auswahl von Methoden oder Tests
Interpretation statistischer Ergebnisse durch KI
Erstellung kompletter Berichte oder Diskussionen
Hochladen sensibler Daten
Unkritisches Übernehmen von Output
Github CoPilot in R
Voraussetzung ist ein Account sowie ein Copilot-Abo (kostenlos für Studierende) auf GitHub.
GitHub ist ein Clouddienst von Microsoft, spezialisiert auf das Teilen und gemeinsame Bearbeiten von Code:
Rechtliche Informationen für Studierende der Universität Bern findet ihr unter: Generative KI Uni Bern
Verwendung von LLMs
Peer Feedback zum Datenanalyseplan
📋To Do’s:
Musterlösung anschauen! (siehe Ordner Abschlussprojekt auf Ilias)
Datenanalyseplan des Partners/der Partnerin bis 15.10. durchschauen und kommentieren (am besten mit Word oder PDF Kommentaren)
Upload auf Ilias mit Kommentaren+ Weitergabe an Partner:in per Email
Auch persönliches Feedback erwünscht 👉 selbstorganisiert
Selbständigkeit: Wir geben kein Feedback, bei Fragen auf uns zukommen (Forum, Sprechstunde etc. nutzen)
Peer Feedback zum Datenanalyseplan
Klarheit und Verständlichkeit (z.B. sind alle Begriffe und Konzepte ausreichend erklärt? Gibt es verwirrende oder unklare Formulierungen?)
Vollständigkeit (z.B. wurden alle notwendigen Fragen ausreichend beantwortet? Fehlen Informationen?)
Reproduzierbarkeit (Ist der Plan so formuliert, dass er von einer anderen Person nachvollzogen und reproduziert werden kann?)
Peer Feedback Regeln
Gib fundiertes, konstruktives und gut strukturiertes Feedback!
Fokus sollte auf inhaltlicher Qualität und Übereinstimmung mit den Anforderungen liegen, nicht auf persönlichen Präferenzen.
Verbesserungsvorschläge sind gewünscht, kein „Schön reden“ notwendig –> wir wollen dazu lernen!
Verbesserungsvorschläge sollten möglichst konkret sein.
Bleibt aber natürlich sachlich und verwendet eine respektvolle Sprache!
Auch Lob für besonders gute Abschnitte darf nicht fehlen. Feedback ist ein Lernprozess, auch für den Gebenden. Seit bereit, euer Feedback anzupassen, wenn die andere Person es anders versteht oder weitere Informationen liefert.
Peer Feedback sollte nicht nur auf die aktuelle Aufgabe abzielen, sondern auch helfen, den Lernprozess der beteiligten Personen langfristig zu verbessern
Heute haben wir:
Datensätze gemerged und diverse joins kennengelernt
Tools für die Fehlerdiagnostik in R kennengelernt
Uns mit Ressourcen und dem Umgang mit LLMS befasst
Abfrage Muddiest Points
Denke an die bisher besprochenen Inhalte zurück – was ist dir unklar geblieben? Was sollten wir noch einmal besprechen?
Denke sowohl an die R Hands On Sessions als auch die theoretischen Inhalte (z.B. Open Science, Datenanalyseplan, Codebook).
Notiere bitte max. drei konkrete Punkte. Falls du Vorschläge/Ideen zur Aufarbeitung dieser Punkte hast, gib diese auch gerne an.
Umfrage auf ILIAS (siehe EH 4) bis Sonntag 12.10. 23:55
Zusammenfassung der To Do’s
Muddiest Points Umfrage bis Sonntag 23:55
Peer Feedback Datenanalyseplan bis Mittwoch
Selbstständiges Durcharbeiten des Hands On Block 2 bis Mittwoch